\documentclass[ucs]{beamer}   % Dokumenten-Art 
%% hier beginnt die Präambel - also der Dokument-Kopf mit Einstellungen für das gesamte Dokument
\usepackage[utf8x]{inputenc}  % Unterstützung für Unicode-Zeichen-Eingabe
\usepackage[T1]{fontenc}      % Unterstützung für Europäische-Zeichen-Ausgabe
\usepackage{ae}               % verbesserte Unterstützung für Umlaute
\usepackage{ngerman}         % deutsche Übersetzungen und Wortumbrücheh
\usepackage[scaled=.90]{helvet}  % schönere Schriftart: Helvetica
\usepackage{mathptmx}            % passende Mathe-Scriftart
\usepackage{courier}             % passende Monospaced-Schriftart
\usepackage{graphicx}
 
%% Theme erst laden nach der Unterstützung für Umlaute!
\usetheme{Berkeley}     % Folien-Stil festlegen
\usecolortheme{dolphin}     % Farbschema festlegen
 
%%% Informationen über den Vortrag festlegen %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\title{Spezifikationsvortrag SWP Gruppe 3}
\subtitle {Translation Memories für automatische Patentübersetzung}
\author{Sabrina Mänz \newline Yoana Nesheva \newline Thomas Wangler}
\institute{Institut für Computerlinguistik}
\date{28.05.2013}
%%%Automatische Gliederungsübersicht aktivieren %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\AtBeginSection[]
{\begin{frame}<beamer>
        \frametitle{Inhaltsübersicht}
        \tableofcontents[currentsection]
\end{frame}
}
 
%%% hier beginnt der Dokumenten-Körper %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\begin{document}
\setbeamertemplate{footline}[frame number] 
 
\begin{frame}[plain]
        \titlepage
\end{frame}

%%%%SABRINA%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Problemstellung}
\begin{frame}
       \frametitle{Problemstellung und Ziel}
       \begin{itemize}
       \item Translation Memory und Statistical Machine Translation
       \item PatTR-Korpus SMT-System lernen
       \item Fuzzy Matches finden (TM)
       \item Bei geeignetem FMS merkliche Verbesserung gegenüber SMT-Baseline
       \end{itemize}
       \begin{center}
       \includegraphics[width=7cm]{/home/sabrina/4.Semester/SWP/Grafik_Alignments.jpg}
       \end{center}
\end{frame}    

\section{Lösungsansatz}
\begin{frame}
       \frametitle{Methoden und Lösungsansatz}
       \begin{itemize}
       \item Aufteilung des Korpus:  Trainings- und Testdaten, zwei Dev-Sets
       \item Trainieren eines Übersetzungssystems mit Hilfe von MOSES
       \item Output: MT-System aus Phrase Table, Language Model und Word Alignment Daten 
       \item Schwerpunkt: für Testdaten XML-Frames zu erzeugen
       \item Parallelisierung via MapReduce bei Fuzzy Matches
       \item Vereinfachung der Suche über
       		\begin{itemize}
       		\item Satzlänge
       		\end{itemize}
       \end{itemize}
\end{frame}

\section{Evaluation}
\begin{frame}
       \frametitle{Evaluation}
       \begin{itemize}
       \item BLEU Score zum Vergleich von Output und Referenzübersetzung \newline
       \item Evaluation gegen SMT-Baseline \newline
       \item Verschiedene Schwellen von FMS werden experimentell getestet
       \end{itemize}
\end{frame}   

%%%THOMAS%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Daten}
\begin{frame}
\frametitle{Daten}
	\begin{itemize}
	\item PatTR Corpus - Englisch/Deutsch parallel, 23M Sätze
	\item Claims-Sektion: ca. 8.350.000 Sätze
	\item Trainings-Set: ca. 75\%
	\item Dev-Sets: ca. 20\%
	\item Test-Set: ca. 5\%
	\end{itemize}
\end{frame}

\begin{frame}
\frametitle{Korpus-Partitionierung}
	\begin{itemize}
	\item Partitionierung anhand von Metadaten \newline
	\item Mögliche Merkmale
		\begin{itemize}
		\item Jahr
		\item IPC-Klassifikation
		\end{itemize}
	\end{itemize}
\end{frame}

\section{Tools}
\begin{frame}
\frametitle{Tools}
	\begin{itemize}	
	\item MOSES: Language Model und Phrase Table \newline 
	\item GIZA++: Erzeugung der Word Alignment Daten \newline
	\item Hadoop: Map-Reduce-Tool zur Parallelisierung der Matchfindung \newline
	\end{itemize}
\end{frame}

\section{GoogleCode}
\begin{frame}
\frametitle{GoogleCode}
	\begin{itemize}
	\item Nutzung der GCode Projektumgebung \newline \newline
	\item Vorteile
		\begin{itemize}
		\item Verfügbarkeit
		\item Struktur
		\end{itemize}
\end{itemize}
\end{frame}

%%%%YOANA%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Workflow-Char}
\begin{frame}
		\frametitle{Workflow}
\end{frame}

\section{Zeitplanung und Aufgabenverteilung}
\begin{frame}
       \frametitle{Zeitplanung}
       \begin{tabular}{l|l}
       Datum & Erledigte Aufgaben \\ \hline
       4.6. & MOSES Aussehen der Alignment-Daten\\
            & um Sample für XML-Generierung zu erstellen \\
       11.6. & Partitioniertes Korpus liegt vor \\
       18.6. & MOSES Korpus fertig trainiert \\
       25.6. & XML-Frames erstellt \\
       2.7. & Testungsphase, läuffähiges Projekt \\
       9.7. & Evaluation \\
       16.7. & Software fertig, Dokumentation\\
             & Vorbereitung des Abschlussvortrags \\
       23.7. & Abschlussvortrag \\
             & Umsetzung, Demo, Schwächen der Implementierung \\ 
       30.7. & Abgabe aller Dokumente (Dokumentation und Readme) \\
       \end{tabular}
\end{frame}   

\begin{frame}
	\frametitle{Aufgabenverteilung}
	\begin{itemize}
	\item Alle sind an allen Schritten beteiligt und informiert. \newline
	\item Schwerpunktverteilung
		\begin{itemize}
		\item MOSES: Sabrina, Yoana
		\item XML-Frames: Thomas
		\item Evaluation: Yoana
		\item Readme: Sabrina
		\item Dokumentation: Thomas
		\end{itemize}

	\end{itemize}
\end{frame}

\section{Quellen}
\begin{frame}
       \frametitle{Quellen}
       \begin{itemize}
       \item Philipp Koehn, Jean Senellart, 2011: Convergence of Translation Memory
and Statistical Machine Translation %Veröffentlichungsort?
       \end{itemize}
\end{frame}   


%%%stinknormale Folie
%\begin{frame}
%       \frametitle{Inhaltsübersicht}
%       Inhalt der Folie
%\end{frame}    
%%%Aufzählung
%\begin{itemize}
%\item Argument 1
%\item Argument 2
%\item[$\Rightarrow$] Schlussfolgerung
%\end{itemize}
%%%\begin{enumerate}
%\item lernen
%\item üben
%\item \ldots
%\item Profit
%\end{enumerate}
%%%Bilder einbinden!!! :)
%\begin{center}
%       \includegraphics[width=7cm]{/home/sabrina/Grafiken1/Tab3.jpg}
%       \end{center}
 
\end{document}
